近期,,360創(chuàng)始人周鴻祎對互聯(lián)網(wǎng)圈進(jìn)行了評論:在ChatGPT領(lǐng)域,,美國超過了我們,,中國公司和科研人員需要加速追趕。
ChatGPT的興起引起了國內(nèi)外互聯(lián)網(wǎng)公司的關(guān)注,。為了應(yīng)對ChatGPT的挑戰(zhàn),,谷歌在2月8日緊急推出了人工智能聊天機器人Bard。國內(nèi)的百度宣布將于3月初推出“文心一言”,,其他互聯(lián)網(wǎng)公司也紛紛效仿,。
截至2月10日,已經(jīng)宣布擁有類似ChatGPT技術(shù)儲備,、準(zhǔn)備發(fā)布和已經(jīng)發(fā)布類ChatGPT產(chǎn)品服務(wù)的國內(nèi)大廠包括:阿里巴巴,、騰訊、華為,、字節(jié)跳動,、京東、360,、科大訊飛,、快手、網(wǎng)易有道等,,超過10家互聯(lián)網(wǎng)巨頭紛紛進(jìn)入了熱門的ChatGPT領(lǐng)域,。
小型科技公司正在跟風(fēng)熱度,大型公司也并非輕松控制ChatGPT,。比如谷歌Bard發(fā)布時,,演示視頻中犯了一個事實錯誤,導(dǎo)致谷歌股價大跌,,目前市值已經(jīng)下降了1700億美元,。
1.扎堆入局ChatGPT競賽
在搜索和AI領(lǐng)域積累最深的百度,自然被市場寄予厚望,。
百度,,作為在搜索和AI領(lǐng)域積累最深的公司,在市場上擁有很高的期望,。計劃在今年三月推出一款類似于ChatGPT的人工智能聊天機器人服務(wù),,名為“文心一言”,英文名為ERNIE Bot,。在內(nèi)測完成后,,將向公眾開放。不同的是,,該工具將初始版本內(nèi)嵌入搜索服務(wù)中,,允許用戶通過對話式方式獲得搜索結(jié)果。
百度的CEO李彥宏在去年9月判斷人工智能的發(fā)展將有“技術(shù)層面和商業(yè)應(yīng)用層面的方向性改變”,。盡管沒有首先推出ChatGPT,,但百度具備了人工智能所需的算力,、算法和數(shù)據(jù),在芯片,、框架,、模型和應(yīng)用四個技術(shù)方面都有布局,是國內(nèi)少數(shù)擁有全棧AI能力的公司,。
相比百度的技術(shù)研發(fā)儲備,,阿里和字節(jié)跳動可能是另外兩個較早布局的玩家。
2月9日,,阿里的達(dá)摩院版ChatGPT在內(nèi)測中預(yù)先曝光,。該新產(chǎn)品具備多種功能,包括知識問答,、人工智能繪畫,、代碼生成、小說續(xù)寫,、文案撰寫和寫詩作詞等,。在人工問答的水平方面,達(dá)摩院版ChatGPT已經(jīng)實現(xiàn)了相對真實的回答,,同時也能實現(xiàn)多輪問答,。
實際上,在2022年5月,,阿里公布了相應(yīng)的能力,,在AIGC方面,隨著超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的發(fā)布,,生成的實景圖片已經(jīng)非常逼真。
阿里現(xiàn)已推出了M6芯片,,支持十萬億的模型參數(shù)規(guī)模,,平均單卡可承載200億參數(shù),同等參數(shù)規(guī)模能耗僅為前業(yè)界標(biāo)桿的1%,,大大降低了大模型訓(xùn)練的門檻,。
字節(jié)動態(tài)正在研發(fā)ChatGPT,雖然全棧技術(shù)不是非常出色,,但在商業(yè)應(yīng)用方面有很大的前瞻性,。字節(jié)動態(tài)從去年開始研發(fā)類ChatGPT項目,現(xiàn)在已經(jīng)在內(nèi)部上線了測試插件,,由AI實驗室主導(dǎo),,還在探索當(dāng)中。此外,,字節(jié)動態(tài)的AML團(tuán)隊也開發(fā)了veGiantModel模型,,類似于為ChatGPT提供支持的GPT-3.5系列模型,。
字節(jié)動態(tài)早就著手研究基于GPT2和GPT3的訓(xùn)練模型和產(chǎn)品,在NLP領(lǐng)域也有許多研究積累,。目前,,字節(jié)動態(tài)在對話機器人、機器翻譯,、機器寫作方面有多項研究,,特別是內(nèi)容創(chuàng)作方面。在ChatGPT用于寫文章之前,,字節(jié)動態(tài)就研發(fā)了Xiaomingbot自動寫稿平臺,,從2016年上線以來,已經(jīng)寫了60萬篇文章,,覆蓋了17場體育賽事,,支持6種語言。
近日,,快手也宣布正在大力研究大型語言模型(LLM),,并已經(jīng)啟動了相關(guān)項目,涵蓋了LLM模型的訓(xùn)練,、文字自動創(chuàng)作和生成,、對話系統(tǒng)的開發(fā)等領(lǐng)域。
另外,,京東云的言犀也宣布將推出工業(yè)版的ChatGPT:ChatJD,,其參數(shù)量預(yù)計為千億級別,主要應(yīng)用于零售和金融兩個領(lǐng)域,。
2.國內(nèi)大廠為何沒能搶得先機,?
近幾年,大量的大公司和研究機構(gòu)加入了人工智能領(lǐng)域,,但真正有實力的玩家并不多,。估測訓(xùn)練1750億參數(shù)的GPT-3語言模型需要上萬個CPU/GPU,持續(xù)輸入數(shù)據(jù)24小時,,而且一次運算就需要450萬美元,,能耗相當(dāng)于開車往返地球和月球。因此,,主流的大型語言模型只能被大型科技公司和少數(shù)研究機構(gòu)掌握,。
從參數(shù)數(shù)量上看,國內(nèi)百度的文心模型有2600億參數(shù),,高于GPT-3的1700億參數(shù),,但參數(shù)數(shù)量不能代表模型的效果。國內(nèi)公司如百度和字節(jié)跳動擁有大量數(shù)據(jù)積累,,但數(shù)據(jù)清洗,、標(biāo)注,、模型設(shè)計、訓(xùn)練和推理等需要時間積累,,這可能是國內(nèi)模型效果不如國外的重要原因,。
關(guān)鍵時間點是2020年年中,GPT3.0剛剛推出,。據(jù)流傳的專家紀(jì)要,,很多人認(rèn)為GPT3.0不僅代表了技術(shù),也是人工智能模型發(fā)展的新理念,,因為開發(fā)商OpenAI對此具有獨到的見解,,領(lǐng)先于國外的Google,國內(nèi)公司比OpenAI晚了兩年,。
許多科技企業(yè)認(rèn)為,,ChatGPT并不是一種革命性的技術(shù)。它是OpenAI對GPT-3模型進(jìn)行微調(diào)后開發(fā)出的對話機器人,,并未實現(xiàn)底層模型的重大突破,,只是通過理解、生成和交些相結(jié)合的方式,,基于人類反饋進(jìn)行強化訓(xùn)練,,從而帶給人們智能的體驗感。
Meta首席人工智能科學(xué)家Yann LeCun也曾表達(dá)過對ChatGPT的看法,,他認(rèn)為它并沒有什么特別的創(chuàng)新,,許多研究實驗室都在使用同樣的技術(shù)。
很多互聯(lián)網(wǎng)企業(yè)沒有意識到ChatGPT對現(xiàn)有搜索模式的顛覆,,也沒有準(zhǔn)確預(yù)測到ChatGPT對腦力勞動者產(chǎn)生替代的關(guān)系,。他們認(rèn)為“聊天”只是一種淺層的應(yīng)用,僅僅是一個更強的聊天機器人,,現(xiàn)階段并不能看到其商業(yè)的潛力,。
同樣的觀點還包括字節(jié)的NPL算法工程師,他認(rèn)為ChatGPT是一個不確定性極高的項目,,國內(nèi)尚未有成功的先例。如果決定全力以赴,,很難獲得資源支持,,更別說提高優(yōu)先級了。因為國內(nèi)的技術(shù)能力有限,,缺少人力,、資金和基礎(chǔ)模型,對于互聯(lián)網(wǎng)大廠這種商業(yè)公司而言,,有著較大的難度,。
造成的結(jié)果表現(xiàn)在不僅認(rèn)知層面存在局限,,在技術(shù)上也有所局限。ChatGPT 的信息截至 2021 年,,這意味著它無法提供實時信息?,F(xiàn)在,百度正在努力解決信息實時性問題,。與此同時,,ChatGPT 已經(jīng)在準(zhǔn)備推出基于 GPT-4 的新產(chǎn)品,國內(nèi)企業(yè)也有了新的目標(biāo)需要實現(xiàn),。
3.跟風(fēng)熱潮中,,誰在硬蹭熱點?
前阿里云大模型負(fù)責(zé)人楊紅霞評論了目前互聯(lián)網(wǎng)公司熱衷于做ChatGPT的現(xiàn)狀,。她表示:“僅有參數(shù)規(guī)模達(dá)到100B以上的大模型才有足夠的實力來提供高質(zhì)量的對話回答,。”
根據(jù)這個標(biāo)準(zhǔn),,百度的飛槳平臺和文心大模型,、阿里的“通義”大模型以及華為的鵬城盤古大模型都有較高的實力。而360,、網(wǎng)易有道以及學(xué)而思等企業(yè)目前技術(shù)研發(fā)水平和進(jìn)度較差,,缺乏相應(yīng)的大模型和技術(shù)儲備。
此外,,還有一些企業(yè)被認(rèn)為是跟隨潮流追風(fēng)口,,比如漢王科技。根據(jù)半年報,,該公司相關(guān)的文本大數(shù)據(jù)業(yè)務(wù)營收僅占總營收的14%,,同比還有下降趨勢。然而,,該公司卻通過炒作ChatGPT概念實現(xiàn)了股價的暴漲,。
近期,越來越多的企業(yè)都在積極使用ChatGPT技術(shù)來提升自身業(yè)務(wù),。然而,,也有一些企業(yè)并沒有采取任何行動,但卻受益于ChatGPT熱潮,。2月8日,,微軟推出了集成了ChatGPT技術(shù)的新版必應(yīng),其回答內(nèi)容中不少答案來自知乎,,該天下午知乎的股價一度漲幅超過56%,。由于ChatGPT可能對社區(qū)問答造成深遠(yuǎn)影響,知乎方面一直對ChatGPT相關(guān)事宜保持沉默。但市場對其仍然熱愛,,帶動了股價的增長,。
有業(yè)內(nèi)人士表示,許多中小型企業(yè)缺乏技術(shù)實力,,但也可以利用開源的Transformer大模型,,在一定程度上實現(xiàn)ChatGPT的功能。
然而,,達(dá)摩院專家表示,,目前大規(guī)模預(yù)訓(xùn)練的基于Transformer的模型雖然能很好地解決感知智能相關(guān)任務(wù),但由于缺乏精心設(shè)計的純Transformer模型,,基本無法實現(xiàn)認(rèn)知智能,。
正如字節(jié)跳動的情況,火山引擎的售前支持人員也表示,,該平臺尚未推出類似產(chǎn)品,,但可以通過機器學(xué)習(xí)平臺與自家產(chǎn)品結(jié)合,經(jīng)過二次開發(fā),,能夠?qū)崿F(xiàn)類ChatGPT的效果,。
4.尾聲
AIGC尤其是目前的ChatGPT確實是非常重要的新方向,不像之前談元宇宙很多人不認(rèn)可,、談28nm落地很多人搖頭,、談國產(chǎn)操作系統(tǒng)大家尷尬一笑,經(jīng)過這段時間發(fā)酵,,和AI相關(guān)的上下游企業(yè)都是非常緊張而且重視的態(tài)度,。
AI產(chǎn)業(yè)的成熟,是大家目前極少數(shù)能看清的,,可以提升整個社會生產(chǎn)效率的可落地工具,,也就是很多年不再提升的全要素生產(chǎn)率,能再上一個臺階的最大希望(很多人原本期待L4自動駕駛會先落地),,經(jīng)濟增長越慢大家才越內(nèi)卷,,AI有可能會讓經(jīng)濟增速上一個臺階。這個方向是幾乎不可能被放棄的,,對于互聯(lián)網(wǎng)頭部企業(yè)而言,,如果這一次的機遇無法把握住,那么像新巨頭字節(jié)之前用算法(當(dāng)時的最新工具)顛覆老巨頭百度這種事情也會有很大概率再次上演,,這也是各家非常緊張的真實原因,。
但是實際來看,也能理解這里算法,、算力、數(shù)據(jù)三個方面的要求都是極高的,所以嚴(yán)格意義上只有巨頭能做,。從事實出發(fā),,我們不能發(fā)現(xiàn),現(xiàn)在連足夠算力的先進(jìn)制程AI芯片都不夠,,目前大家能想到的妥協(xié)方案是用CPU來頂,。所以小公司撐不起全譜系A(chǔ)I研發(fā),大概率仍舊是接入端口部署應(yīng)用,,包括最后國內(nèi)能活下來的AI平臺,,可能也就是兩至三家;
如果類比AI產(chǎn)業(yè)對于,,就如8年前伊始的新能源汽車,,有兩三年的技術(shù)代差,但是核心技術(shù)沒有實質(zhì)性壟斷,、沒有專利權(quán)鐵桶,、沒有制造業(yè)上的硬門檻,目前對于國內(nèi)最尷尬的是算力芯片的困局,,但是在其他領(lǐng)域(數(shù)據(jù)源,、人工標(biāo)注、中文語境)是有比較優(yōu)勢的,,有點像當(dāng)年新能源車?yán)镂覀冇校▏鴥?nèi)市場,、人工、電池,、補貼)這些優(yōu)勢一樣,。希望是靠著補貼、市場容量,、制造業(yè)優(yōu)勢(這次是數(shù)據(jù)源優(yōu)勢),,能彎道超車,起碼不落后,。
包括騰訊,、阿里、字節(jié),、小紅書,、菜鳥等互聯(lián)網(wǎng)公司,已經(jīng)在NPL算法工程師等相關(guān)招聘崗位中,,加入了從業(yè)者需了解熟悉GPT-3等相關(guān)模型的要求,。而招聘的月薪多在4萬元左右,最高可達(dá)10萬元,。
2023年,,ChatGPT點燃的這把火,,可以淬煉出真金的企業(yè)和人才,也可以蒸發(fā)掉虛妄的概念,。最后想說的是,,ChatGPT是開胃菜,GPT4.0才是大餐,。